科学匠人特别篇 | 洪小文:少数派报告
编者按:洪小文读书的时候是学霸,却在求职时因为成绩太好被拒绝;曾与师兄李开复以独特的方式做语音识别研究,却不被主流认同。“少数派”洪小文如今已经是微软亚洲研究院的院长,在人工智能领域倾注了30年的时光,他说:“你一定要对你做的东西喜欢,你才可以从中领略它的美。”对于工匠精神,洪小文的理解是要把一个东西做到极致,同时微软也会坚持在技术研究、产品开发、人才培训三个方面践行工匠精神。关于未来,洪小文仍旧充满信心,AI(人工智能)+HI(人类智能)会创造出更美好的未来。本文转载自《北京青年周刊》。
洪小文博士,现任微软全球资深副总裁,微软亚太研发集团主席,兼微软亚洲研究院院长,全面负责推动微软在亚太地区的科研及产品开发战略,以及与中国及亚太地区学术界的合作。 洪小文博士是电气电子工程师学会院士(IEEE Fellow),微软杰出首席科学家和国际公认的语音识别专家。洪小文博士毕业于台湾大学,获电机工程学士学位,之后在卡内基梅隆大学深造,先后获得计算机硕士及博士学位。
洪小文的办公室在微软大厦 2 号楼的14 层,拥有一整面墙的落地窗,通透开阔。向外眺望,北京大学的“一塔湖图”尽收眼底,更远处是圆明园,向西,仔细一点还能捕捉到颐和园佛香阁的影子……位置是洪小文自己挑选的,他的办公桌就面对着这片得天独厚的风景,一抬眼就可将皇家园林、大学和小半个中关村一览无余,“非常爽”。他背后,则是整面墙的“黑板”,上面密密的满是代码、数字的痕迹……采访中,遇到一个记者不太明白的英文词,洪小文起身,迅速找到“黑板”上还有点空的地方写下来,这种随时解决问题的习惯让记者感受到了微软的工作氛围。
身为微软亚洲研究院院长的洪小文,给人以温和儒雅的印象,这和很多中国科技、互联网公司的高管们身上散发的草莽气和霸气非常不同。不同于“熊孩子”周鸿祎和农村走出来的刘强东,洪小文的经历与他的师兄李开复更相似,一直是个大家口中的“别人家的孩子”。中学就读的是台北最富声望的建国中学,成绩十分优异——他承认如果以考试成绩来定义学霸的话,他就是一个十足的学霸,对于考试总是得心应手。
被问及年少时的理想,他朴实得很,“那时可不敢称有理想。”对于他们那一代人,读书是改善经济条件和社会地位的通道,非常现实,因为家里经济条件很有限。当然他也有过理想的职业,由于小时候身体不好,常常看病,就想将来做一名医生。谁知初中的一堂生物课上要解刨青蛙,连碰一碰青蛙都哆嗦的他,立马打消了做医生的念头。几年后的高考,他像很多成绩顶尖的孩子一样,报考了台湾排名第一的学府里理工科最热门的专业——台湾大学电机系。
洪小文告诉记者,在 80 年代的台湾,成绩好的孩子可选择的路似乎只有一条——就是出国留学,读博士,进研究所。在大学依旧心无旁骛读书的他,也从来没有考虑过另外的可能。他的成绩在 180 多人的电机系里,依然排在前三名。“不是有什么理想,你不要以为我想清楚了,甚至半开玩笑地讲,不读书我就失业啦。”毕业时,他耽搁了一年才申请出国,这一年做什么呢?他去惠普求职,没成想,对方看了他的成绩单,却说,“你成绩这么好,将来肯定是要出国读书的,留不下来。”因为优秀反而被拒绝了,这让洪小文哭笑不得。
记得第一次坐飞机时,他感到十分新奇。他的目的地是美国的一个东北部城市匹兹堡,之前他对它的了解并不多。但在那里,却坐落着足以改变世界的所在——计算机和人工智能的研究重镇——卡内基梅隆大学计算机系。那里拥有最顶尖的硬件设备,1980年代就能使用互联网了。而洪小文的导师是语音识别领域的泰斗,图灵奖的获得者罗杰·瑞迪教授,而他的同门师兄就是李开复。
之所以选择这条道路,洪小文觉得,人工智能很神奇,也很难,需要很多智慧,这 是吸引他的原因,“ 觉得这个东西很fascinating”。那时,学界的主流是以专家系统为基础的语音识别系统,而李开复和洪小文则抛弃了这个方向,另辟蹊径地进行基于大数据和统计学的语音识别的探索。在那时,他们的选择是小众,是非主流,连导师都不认同他们,但他们自己却坚定得很,直到被命名为“斯芬克斯”的语音识别系统的诞生,证明了他们敏锐的判断。
任何一种颠覆性的事物,在没有做出来之前一定是寂寞的。洪小文的博士生活大部分是晨昏颠倒的,每天除了想点子,就是编程,尤其在匹兹堡这样的偏僻之乡,冬天下雪时,他便一个礼拜不出门,窝在家里专心搞研究。“常常会钻到死胡同,遇到 bug,当遇到一个难题,陷到里面了,哇,每天废寝忘食。但过后来看,都没有什么。唯一比较难忘的是最后写论文时,写作并不是我拿手的事情,写一篇博士论文很像写一本书,我就知道我这一辈子不可能做作家,所以很羡慕写手。”
回望自己求学、做研究的历程,洪小文提到了工匠精神。“我这一辈子做事,不做则已,做了就专心把它做好。但首先你一定要对你做的东西喜欢,你可以从里面领略它的美,每天即使遇到挫折也可以看到希望。然后,常常有些小成果也很重要,这样才能让你不断地精益求精。”在人工智能领域里,洪小文专注了 30 年。博士毕业后,他并没有去他曾一度向往的贝尔实验室和 IBM Watson 实验室,而是选择了地处硅谷的苹果公司。洪小文看中的是它的创新精神和对语音识别的积极投入。
但 90 年代后期,苹果走了下坡路。同时,微软则一步步地奠定着它在行业内的老大地位。1995 年,洪小文加入微软研究院美国总部任高级研究员,后来成为微软美国总部所有语音技术研发的总架构师。1998年微软建立了中国研究院(后更名为亚洲研究院),虽然错过了成为元老的机会,但洪小文面试了这里的第一批研究员。2004 年,对研究院充满感情的洪小文终于来到微软亚洲研究院,负责微软在亚太地区的研究和学术合作,在中国内地一呆就是 13 年,如今的他是微软亚洲研究院院长兼微软亚太研发集团主席。
当下,AI 热得炸裂。科技公司们不吝大把投资,新应用层出不穷。但在洪小文看来,AI 并非“忽如一夜春风来,千树万树梨花开”,在快速更迭的 AI 产品背后,人们常常忽略研究者们如匠人一般长达 61 年的执着钻研。“作为一个科学家、研究员,必须要一直专磨一个东西,就像引力波,爱因斯坦一百多年前的预测,然后就有一群人花了这么多时间努力地去做天文望远镜,终于有了今天的发现。而我们今天的世界变化好快,但没有前人种树,哪有后人乘凉,这里的工匠精神不只有我们自己,还有更早的提出理论基础的人。说到 AI,61 年前就是我的祖师爷 John McCarthy 在达特茅斯的会议上,第一次提出了 AI 这个词,我们知道他是大师,但在 AI 的发展史上还有很多无名英雄,正是因为有这么多人的工匠精神,今天我们才可以用手机刷脸,与小冰、小娜对话。”
微软HoloLens全息眼镜,利用混合现实(MR)技术将虚拟信息叠加在现实世界的画面上,从而帮助工程设计、建筑、医疗、教育等多个领域更加直观、便捷的从事相关工作。
而微软的研究院文化正是对工匠精神的践行。微软早在1991年就成立了研究院, 那时公司尚处幼年,DOS 和Windows 系统还未问世,微软就已经认识到基础研究的重要性,目标就是为了能实现人工智能,让电脑能看、能听。1998年,微软中国研究院成立,后来发展为微软亚洲研究院,这是首批跨国公司在中国成立的研究院。“在中国,微软是先成立研究院,先有研究,再成立产品部门,这是很少见的。对研究和技术的投资,除了支持公司的长久经营,也是对人类的一个贡献。在众多本土和跨国公司里,这是一个异数,也是一个奇葩。”
在言必谈 AI 的时代,我们看到了微软小冰、小娜、小英的横空出世,但很多人也许并不清楚微软在 AI 上的布局。洪小文说,微软的 AI 策略是将 AI 平台化,让 AI 普及化。“比如,做无人车都需要用一个有 AI 技术和服务的云平台,那我们不做无人车,我们做云平台,与很多汽车厂商合作。”微软面向的是企业,提供AI 解决方案和服务,帮助它们实现数字化转型,或提升运营效率。洪小文打了一个形象的比方:“淘金的时候谁真正赚的钱多呢?是卖铲子的人,而不是去淘金的人。你这样想,去淘金的人,有人淘到了,有人没淘到,但不管你有没有淘到,你都得买铲子。”这就是微软的角色。
Surface Studio
微软为什么要在中国建立研究院?
洪小文:微软 1998 年建立中国研究院就是为了人才,现在看中国是世界最大的市场,但当时大家虽然也这样想,事实上却并非如此,尤其 1997 年中国刚经历过亚洲金融风暴。但是盖茨先生,来到中国,看到中国的人才,也看到海外的中国人才,更重要的是,中国对技术的重视,很多学生学习理工和高科技,让他相信我们要把研究院建立到人才聚集地去。大部分公司会先做产品开发,达到一定规模后才做研究院,像很多中国公司,即使达到一定规模,做研究院的也是凤毛麟角,而且即使有也未必做真正最前沿的研究。而微软在中国是先成立研究院才去做产品开发,这是很少见的。
中国研究院后来升级为亚洲研究院,它与美国的研究院在研究方向等方面有什么不同?
洪小文:这要说说我们研究院的文化了。我们研究院里是自下而上来定方向的,而不是自上而下。本来自上而下、由领导定方向应该是很自然的,但研究这种东西,不是定方向就有用,因为首先要有人才,所以我们基本上采用了自下而上的研究管理。最了不起的一点就是,当年全世界很多人都怀疑中国人可不可以做最前沿的研究,我们就让中国研究员自己来决定我们要做什么,这在全球跨国公司研究院里没有先例,这就给了我们空间。那我们怎么去做呢?第一步先去招聘最优秀的人才,假如中国有很多人做计算机视觉,那么我们就去做计算机视觉。比如一开始中国做系统工程这方面的人才比较少,我们这方面发展得就比较慢,所以能招到什么样的人,就让这些人先去做,方向就是这样来的。我们先做出来的是多媒体这一块,如图形学、计算机视觉,接着第二块就是自然语言、语音,这些都是现在大家讲的 AI,再后来就是系统和网络等部分。
Microsoft Pix 手机应用中的修图黑科技——风格迁移技术,让你增加图片的艺术化风格,创造出媲美大师的作品。
你提到了工匠精神,你对工匠精神的理解是什么?
洪小文:工匠精神更多的是对一个东西的执着,但研究者的执着可能跟产品的 idea 和商业模式的创新有点不一样,那种东西变化很大,如果看准了会非常成功,但研究上的工匠精神是说,我这一辈子就是要把计算机语音做到极致。当然技术研究和商业模式这两者是相辅相成的,不能说商业模式的创新不重要,但没有工匠精神是绝对做不好的,比如手机的触摸屏,二十几年前就有了,但触摸技术必须要好到一定程度才能做成现在的手机,包括软件和硬件的配合。虽然今天的社会看起来变化很快,背后要有工匠精神支撑的技术,才有可能抓住机遇获得成功。
微软是怎样从技术研究、产品开发、人才培训三方面践行工匠精神的?
洪小文:技术研究方面,还是拿语音识别来说,我自己就在语音识别方面做了三十几年,很久以来在语音识别领域有一个非常有名的基准测试叫Switchboard,做语音识别的公司和研究团队都会通过 Switchboard 来测试自己的系统性能。多年来,微软的语音识别研究员们一直在不断精进我们的语音识别系统,不断刷新系统在 Switchboard上的测试结果。就在最近,我们的系统将错误率降低到 5.1%,首次超越了人类专业速记员的水平,我在刚开始做语音研究的时候没有预测到今天我们能够做到这个地步,现在我们把这个技术逐步做到极致,靠的就是工匠精神。
在产品方面更是这样,技术归技术,技术变成产品只靠研究员是不够的,那我就用微软的几个产品来讲。我们几年前做的 Kinect camera,就是 Xbox 上面的深度摄像头,它可以识别你的动作和话语,还有现在我们做的 HoloLens,一个混合现实技术的计算设备,都投入了大量的人才、资金,到今天我们都是百分之百领先的。最初在做这些新产品的时候,我们考虑的并不是它能卖多少钱,而是如何做出一个代表最先进技术的产品,这里面的每一个细节,都是对一个产品的执着。还有Windows、Office 等帮助大家提高生产效率的工具,虽然我们常常讲“这不是新产品,是旧产品”,但这些部门的同事每天都在设计,如果产品使用中的每个步骤能够给人们节省半分钟,那全世界可以省下多少人的时间?就是这样的一个理念来推动我们的产品这么多年来不断往前走。
近期,微软展示了拓扑量子位以及硬件软件生态系统开发方面取得的进展,发布了为驾驭规模化量子计算机而专门优化的新的编程语言,让开发者能够编写量子程序,在当前的量子模拟器上调试,并能够在未来真正的拓扑量子计算机上运行。图为微软量子设备。
在人才的培养方面,我们这里有最自由宽松的环境,我们相信自下而上的创新,因为科学家是不能去管理的,可以引导,但最后一定要让他做他喜欢的事。另外就是鼓励同事之间的学习,我们的员工跨领域彼此接触、交叉,可以碰出更大的火花,一加一大于二。我们研究院明年就成立二十年了,一直被媒体称作中国 IT 届的“黄埔军校”,有很多以前在这里服务的院友现在到其他地方功成名就,这是一个荣耀。我当然希望每个员工都能留在这里,但有些人一定会想要换跑道,有一天要退休,那一定要有人才机制,当有人离开时,不单有人进,而且进的人我们还可以把他培养成人才作为未来的IT界领袖。以这个角度看,这就像办学校,任何一个人他不但来上班,还希望他学习了一些东西,从这个公司出去时他的价值提高了。我觉得对人才培养的执着和投入也是另外一种工匠心。
科技行业的创新很快,如何保持创造力和对趋势的敏感?
洪小文:首先你要懂得欣赏美的东西。无论产品还是项目,要分得出好坏。如果给你两个研究项目,都和你有关,两个差不多,你分不出差别,那你不太可能精益求精了。第二,还要对现实不满。在计算机这个行业,我们永远没办法做到最好,永远可以提高,你会不满足于现状,这就会驱动你创新。然后我觉得你还要保持一个好奇心!比如有些东西可能跟你做的项目看起来不相关,但是你好奇以后,很有可能会碰撞出意想不到的火花。如果没有好奇心,只专注于自己的东西,有时会钻到死胡同自己都不知道。
在微软的发展中有些什么遗憾的事?
洪小文:智能手机不用说了,的确没有做好,对我们来讲很痛,还有社交网络我们没有自己做,但这个世界就是这样,没有一个公司可以拥有全世界所有东西,分析过去很重要,但未来更重要,了解下一波的成长在哪里更重要。从结果来说,我们还是很欣慰,2000 年全世界十大公司里面,我们排前三,今天全世界十大公司里,我们依然排前三,这个排名一直不断重新洗牌,只有我们一家公司保持在这里面没有改变,这已经非常不容易了。有很多正面的例子,比如像云,我们事实上做得不晚,当然亚马逊、阿里做得也很好,我们最近公布了最新财报,Microsoft Azure的成绩非常好,所以这个云我们是抓住了,但几年前可能没有人相信我们可以。然后是 MR,混合现实技术,我们做了 HoloLens,我们最近还推出了更便宜的版本。我们把 AI 平台化,也肯定是领先的。还有我们中国团队做的认知服务,推出了小冰、小娜,小冰甚至还出了诗集,将来还会带给我们更多惊喜。我们的微软小英,将人工智能技术跟人结合,帮助大家学外语,才一年多就有超过百万用户,还和朗文、珠江电视台、二十一世纪英文报等进行合作。 微软在 AI领域的这个布局我们觉得非常之高兴。
尤瓦尔在《未来简史》里担心 AI会使人变成机器的奴隶,你怎么看?
洪小文:我觉得任何一件事情都在于我们自己。我们老祖宗就讲过,要以人役物,不要物役人。我对人是有信心的,我相信人类智慧,这些东西都是我们制造出来帮助人类的,一定要了解他们背后带来的深刻意义,而不是完全反过来,这个世界变成他们在掌控。对此我比较乐观,我不太相信会有这样的事情发生。尤瓦尔举过一个例子,说以后找男女朋友,两个人的信息列出来,如果速配,可以;如果不速配,就分手。中国以前也有,叫八字。有的父母见人家虽然情投意合,但八字不合,还是硬把人家分开,我们也看过这样的故事,对不对?但是我们也知道,最后还是人要去决定的,人不会真的昏庸得让机器做决定到这个地步,毕竟大事是掌握在你手里的。有时候有一些事情我们没有做出决定,会去问心理学家,问哲学家,但是不代表我不会为这个决定去负责,那只代表我这个人很纠结。很多人问我当年为什么去苹果,而没有去 AT&T,当年我也很有可能去 AT&T。因为未来是未知的,没有一个要保持好奇心,‘哎,这个东西不错,这个想法不错,可以跟我的结合’。做科研还要想、要思考,有时候左脑和右脑互相搏击,看哪个 idea 可以出来,这是很迷人很有趣的。人知道什么是正确的,即使很多人可以做大数据分析,但我们就 make decision, move on,人都是这样过活的嘛。我们没有必要这么悲观,我们用大数据,不代表我就在完全无知的情况下,让它做了主。我觉得这是不太可能的。
你从接触 AI 开始到现在的 AI 大热,对 AI 的感情有什么变化吗?
洪小文:可以说现在我对 AI 的理解比过去更加成熟。对 AI 的了解越多,就会越来越觉得人的智慧非常了不起。虽然人现在已经在很多方面比不过计算机,比如记电话号码、下棋,但这就好比让你去跟车子赛跑,你跑不过车;飞机会飞,你也不会飞呀……你会很沮丧吗?我觉得很多时候是个观念问题,下棋本身就没有太多智慧在里面,今天你算数算不过计算机,你绝对不会以之为耻。人的智慧到最后是什么?其实是更高层次的创造力。大师讲的一个似是而非的东西,充满了智慧。比如,金庸《倚天屠龙记》中,张三丰教张无忌太极剑法,第一次舞了一遍,张无忌说,我这次记得了七成,太师傅说好。张三丰又舞了第二次,张无忌说糟糕,这次怎么我只记得了五成,张三丰说有进步。又舞了一次,张无忌说这次一成也记不得了,张三丰说,那你真的融会贯通了。这就充满智慧。我们中国诸子百家的智慧,AI 根本就替代不了。说穿了,AI 现在还是做一些重复性的事情,很枯燥乏味,机器做得比我们好我很高兴呀,为什么我要做这种工作呢?我现在越做 AI 越觉得,AI 很有用,对人们生活起到很大帮助;另外,AI 和 HI(人类智能)的结合,让我们做每一件事有数据参考,而不是在黑暗中摸索,但你自己要拿决定。人的智慧是无边的。
你也许还想看:
感谢你关注“微软研究院AI头条”,我们期待你的留言和投稿,共建交流平台。来稿请寄:msraai@microsoft.com。